Cette activité propose de vous faire découvrir comment un moteur de recherche indexe les différentes pages web qu'il a en mémoire.
Un moteur de recherche doit charger périodiquement toutes les pages web qu’il désire indexer. Il dispose de plusieurs robots qui chargent les pages web en parallèle. Ils se répartissent les adresses URL de façon équitable pour qu’une même URL ne soit pas chargée deux fois : on pourrait imaginer qu’un robot charge toutes les URL débutant par « A », un autre, celles débutant par « B », et ainsi de suite.
En pratique, on définit plutôt une fonction de hachage qui convertit l’URL en un nombre.
Soit la liste de vingt cinq mots :
00 vie(s), 01 saison(s), 02 continent(s), 03 femme(s), 04 homme(s), 05 enfant(s), 06 monde(s), 07 chat(s), 08 voiture(s), 09 couleur(s), 10 quatre, 11 cinq, 12 rouge(s), 13 bleu(es), 14 meilleur(es), 15 belle(s), 16 perdu(es), 17 est, 18 sont, 19 dans, 20 ont, 21 garage(s), 22 fou(s), 23 folle(s), 24 doué(es).
1. Écrire une phrase qui représente le titre d'une page web, avec 3 ou 4 mots clés choisis dans la liste. Les articles LE, LA, L’, LES, UN, UNE, DE, D’, DES etc. et les adjectifs possessifs MON, SA, SES, SON etc. ne sont pas comptés.
Le moteur de recherche peut maintenant indexer l’ensemble de la phrase en commençant par la page, le mot puis sa position dans la phrase.
Exemple pour une page 3 : « Le chat perdu et l'enfant » ce qui donne : 3070, 3161, 3052 (3 P3 - mot 05 - position 2).
Source : https://lesmanuelslibres.region-academique-idf.fr Télécharger le manuel : https://forge.apps.education.fr/drane-ile-de-france/les-manuels-libres/snt-seconde ou directement le fichier ZIP Sous réserve des droits de propriété intellectuelle de tiers, les contenus de ce site sont proposés dans le cadre du droit Français sous licence CC BY-NC-SA 4.0